A Universalidade da Linearidade é talvez o atalho mais poderoso na teoria das probabilidades. Permite-nos calcular a expectativa de uma soma de variáveis aleatórias somando simplesmente suas expectativas individuais — independentemente de essas variáveis serem independentes, correlacionadas ou mutuamente exclusivas.
1. Fundamentos e Proposição 2.1
Para entender por que a expectativa se comporta tão linearmente, examinamos o Teorema do Estatístico Inconsciente (LOTUS) para sistemas multivariados. Proposição 2.1 afirma que, se $X$ e $Y$ têm uma função de massa de probabilidade conjunta $p(x, y)$, então a expectativa de qualquer função $g(X, Y)$ é:
$$E[g(X, Y)] = \sum_{y} \sum_{x} g(x, y) p(x, y)$$
Para variáveis contínuas com função densidade de probabilidade conjunta $f(x, y)$, a forma equivalente em integral é:
$$E[g(X, Y)] = \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} g(x, y) f(x, y) dx dy$$
2. O Princípio da Linearidade
Aplicando o LOTUS à função $g(X, Y) = X + Y$, derivamos o teorema central desta lição: $E[X + Y] = E[X] + E[Y]$. Isso se estende naturalmente a qualquer coleção finita:
$E\left[\sum_{i=1}^n X_i\right] = \sum_{i=1}^n E[X_i]$
Isso é "universal" porque não exige suposições sobre a distribuição conjunta. Independentemente de as variáveis serem independentes ou fortemente dependentes, a média da soma é a soma das médias.
Exemplo 2a: O Problema do Ambulância
Considere um acidente na localização $X$ em uma estrada de comprimento $L$ e uma ambulância na posição $Y$, onde $X, Y \sim U(0, L)$ e são independentes. Usando o LOTUS multivariado para encontrar $E[|X-Y|]$:
A função densidade conjunta é $f(x, y) = 1/L^2$ para $0 \le x, y \le L$.
$$E[|X-Y|] = \int_0^L \int_0^L |x-y| \frac{1}{L^2} dx dy = \frac{L}{3}$$
3. Monotonicidade e Limites
A expectativa preserva a ordem das variáveis aleatórias. Se $X \ge Y$ para todos os resultados, então $E[X] \ge E[Y]$. Isso decorre do Exemplo 2b: se $X - Y \ge 0$, então $E[X - Y] \ge 0$. Além disso, se uma variável é limitada de modo que $P\{a \le X \le b\} = 1$, então segue-se que $a \le E[X] \le b$.
4. A Média Amostral (Exemplo 2c)
Seja $X_1, \dots, X_n$ uma amostra de uma distribuição com média $\mu$. A média amostral é definida como:
$$\bar{X} = \sum_{i=1}^{n} \frac{X_i}{n}$$
Devido à linearidade, $E[\bar{X}] = \frac{1}{n} \sum E[X_i] = \frac{n\mu}{n} = \mu$. O valor esperado da média amostral é $\mu$, provando que é um estimador não enviesado.
- As $X_i$ são todas variáveis aleatórias não negativas.
- A série é absolutamente convergente: $\sum_{i=1}^\infty E[|X_i|] < \infty$.